sampling distribution

Mean

$\bar{X} =\frac{X_1+...+X_n}{n} = \frac{1}{n} \sum X_i$

$\min _a \sum (x_1 -a)^2 = \sum (x_i -\bar x)^2$ $min_{a} \sum (x_{1} - a)^{2} = \sum (x_{i} - \overset{x}{ˉ})^{2}$
- $\bar {x}$ 使得 $x_i$ 的距离和最短
$E(\bar{X}) = \mu$ $E (\overset{ˉ}{X}) = μ$
- 表示样本均值是一个无偏估计
$Var(\bar{X} ) = \frac{\sigma^2}{n}$ $V a r (\overset{ˉ}{X}) = n σ ^{2}$
- 可以看出，其方差随着 $n$ 的增大减小，也就是说，增大样本量可以使得估计更为准确。

Variance

$S= \frac{1}{n-1}\sum (X_i-\bar{X})^2$

$(n-1)S^2 = \sum_{i=1}^n x_i^2 - n\bar{x}^2$ $(n - 1) S^{2} = \sum_{i = 1}^{n} x_{i}^{2} - n \overset{x}{ˉ}^{2}$
- 只需要扫描一遍数据
$E(S^2) = \sigma^2$ $E (S^{2}) = σ^{2}$
- 表示严格方差为无偏估计

Lemma

若 $X_1,...,X_n$ 是来自同一分布的样本，令 $g(x)$ 为它的一个函数，同时，若 $E(g(X_1))$ 和 $Var(g(X_1))$ 存在，则：

$E(\sum g(X_i)) = n \cdot E(g(X_1))$

$Var(\sum (X_i)) = n\cdot Var(g(X_1))$
考虑均值矩母函数与随机样本的关系：

$M_{\bar{X}}(t) = [M_{X}(\frac{t}{n})]^n$

Theorem

$\bar{X}$ 和 $S^2$ 相互独立
$\bar{X} \sim N(\mu,\frac{\sigma^2}{n})$
$\frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1)$

为什么自由度为 $n-1$ ？
- 在用样本方差估计总体方差时会需要用到样本均值，而样本均值就决定了变量值的总数。

Convolution theorem

若 $X$ 和 $Y$ 是两个相互独立的连续随机变量，那么 $Z = X+Y$ 的pdf为：

$f_Z{z} = \int_{-\infty}^{+\infty} f_X(w)f_Y(z-w)dw$

Order statistics

The order statistics of a random sample $X_1,...,X_n$ are the sample values placed in ascending order. denoted by $X_{(1)},...X_{(n)}$

Distribution

discrete case

Define $P_i = p_1 + p_2 + ... + p_i$ ,then:

$P(X_{(j)}\le x_i )= \sum_{k=j}^nC_n^k P_i^k(1-P_i)^{n-k}$

continuous case

$f_{X_{(j)}}(x) = \frac{n!}{(j-1)!(n-j)!}f_X(x)[F_X(x)]^{j-1}[1-F_X(x)]^{n-j}$

Joint distribution

$f_{X_{(i)},X_{(j)}}(u,v) = \frac{n!}{(i-1)!(j-1-i)!(n-j)!} f_X(u)f_X(v)[F_X(u)]^{i-1}[F_X(v) - F_X(u)]^{j-i-1}[1-F_X(v)]^{n-j}$

Limit theory

Convergence in probability

A sequence of $X_1,X_2,...,$ converges in probability to a r.v $X$ , if for every $\epsilon >0$ :

$\lim\limits_{n\to \infty} P(|X_n - X| \ge \epsilon ) = 0$

可以使用切比雪夫不等式证明，样本均值依概率收敛到0

Weak law of large numbers

Let $X_1,X_2,..$ be i.i.d. with $E(X_i) = \mu$ and $Var(X_i) = \theta^2 < \infty$ :

$\lim\limits_{n\to \infty} P(|\bar{X} -\mu | < \epsilon ) = 1$

可以使用切比雪夫不等式证明，样本方差依概率收敛到0，符合弱大数定理

Almost sure convergence

A sequence of $X_1,X_2,...,$ converges almost to a r.v $X$ , if for every $\epsilon >0$ :

$P(\lim\limits_{n\to \infty}|\bar{X_n}-X|< \epsilon) = 1$

几乎处处收敛一定是依概率收敛

Strong law of large numbers

Let $X_1,X_2...$ be i.i.d. r.v.s with $E(X_i) = \mu$ and $Var(X_i) = \theta^2 < \infty$ :

$P(\lim\limits_{n\to \infty}|\bar{X_n}-\mu|< \epsilon) = 1$

Convergence in distribution

A sequence of $X_1,X_2,...,$ converges in distribution to a r.v $X$ , if for every $\epsilon >0$ :

$\lim\limits_{n\to \infty} F_{X_{n}} (x) = F_{X}(x)$

依分布收敛最弱
若满足依概率收敛，一定满足依分布收敛

Central limit theorem

Let $X_1,X_2...$ be a sequence of i.i.d r.v.s whose mgfs exist in a neighborhood of 0. Let $E(X_i)= \mu$ and $Var(X_i) = \sigma^2>0$ .

$\frac{\sqrt{n}(\bar{X_n}-\mu)}{\sigma} \sim N(0,1)$

Slutsky's Theorem

Let $X_n \to X$ in distribution and $Y_n \to a$ ,a constant, in probability, then:

$Y_nX_n \to aX$ in distribution
$X_n+Y_n \to X + a$ in distribution

这告诉我们，乘积和极限可以交换位置。因此不难得到：

$\frac{\sqrt{n}(\bar{X_n}-\mu)}{S_n} = \frac{\sigma}{S_n}\frac{\sqrt{n}(\bar{X_n}-\mu)}{\sigma} \to N(0,1)$

Sample And Limit Theory